All Posts
News bits
Gemini API に大幅な機能拡張が追加
Gemini API に大幅な機能拡張が追加
Google I/O 2025 で Gemini API に多数の新機能と改良が発表された。新モデルの追加、思考プロセスの可視化、ツール連携強化、動画理解向上など、開発者向けの大幅な機能拡張が実施。特にエージェント開発やマルチモーダル対応、リアルタイム生成機能が大幅に強化された。
API で利用できる新しいモデル:
- Gemini 2.5 Flash Preview (05-20 版):推論・コード・長文対応が向上、LMarena で#2 位を獲得
- Gemini 2.5 Pro/Flash TTS:24 言語対応、複数話者での音声生成が可能
- Gemini 2.5 Flash native audio dialog:Live API 経由で 30 以上の音声、24 言語での対話が可能
- Lyria RealTime:WebSockets でリアルタイム音楽生成、PromptDJ-MIDI アプリで体験可能
- Gemini 2.5 Pro Deep Think:複雑な数学・コーディング問題向けの実験的推論モード
API の新機能:
- Thought summaries:モデルの思考プロセスを要約して可視化
- Thinking budgets:思考量を制御して性能・レイテンシ・コストをバランス調整
- URL Context tool:リンクから追加コンテキストを取得、Google 検索との併用可能
- Computer use tool:Project Mariner のブラウザ制御機能を API 経由で提供
- Structured outputs 強化:JSON Schema の$ref や tuple 構造定義をサポート
- Video understanding 改良:YouTube URL 対応、動画クリッピング、可変 FPS(0.1-60fps)、3 段階解像度選択
- Async function calling:Live API でバックグラウンド関数実行中も会話継続可能
- Batch API:最大 24 時間処理、通常 API の半額、高いレート制限
Google AI Ultra、最高レベルの AI 機能を統合したサブスクリプションプラン発表
Google AI Ultra、最高レベルの AI 機能を統合したサブスクリプションプラン発表
Google が Google AI Ultra を発表。映画製作者、開発者、クリエイティブプロフェッショナル向けの最高レベル AI サブスクリプションプラン。月額$249.99(米国、初回 3 か月は 50%オフ)で、最高の使用制限と最先端モデルへのアクセスを提供。Gemini、Flow、Whisk、NotebookLM、Project Mariner、YouTube Premium、30TB ストレージを統合し、従来の Google AI Premium(現 Google AI Pro)を大幅に上回る包括的な AI サービスパッケージを実現。
- Gemini:最高使用制限、Deep Research、Veo 2/3 動画生成、Deep Think 早期アクセス
- Flow:AI 映像制作ツール、1080p 動画生成、高度カメラコントロール、Veo 3 早期アクセス
- Whisk:Whisk Animate で画像を 8 秒動画に変換(Veo 2 使用)
- NotebookLM:最高使用制限と強化モデル機能
- Chrome 内 Gemini:ブラウザ内直接アクセス(早期アクセス)
- Project Mariner:10 タスク同時管理可能なエージェント研究プロトタイプ
- YouTube Premium:広告なし視聴・オフライン再生
- ストレージ:30TB(Google Photos、Drive、Gmail 対応)
既存の AI Premium プランは Google AI Pro に改名され、Flow と Chrome 内 Gemini アクセスが追加。
出展:Introducing Google AI Ultra: The best of Google AI in one subscription
著者について
Hi there. I'm hrdtbs, a frontend expert and technical consultant. I started my career in the creative industry over 13 years ago, learning on the job as a 3DCG modeler and game engineer in the indie scene.
In 2015 I began working as a freelance web designer and engineer. I handled everything from design and development to operation and advertising, delivering comprehensive solutions for various clients.
In 2016 I joined Wemotion as CTO, where I built the engineering team from the ground up and led the development of core web and mobile applications for three years.
In 2019 I joined matsuri technologies as a Frontend Expert, and in 2020 I also began serving as a technical manager supporting streamers and content creators.
I'm so grateful to be working in this field, doing something that brings me so much joy. Thanks for stopping by.